Hablemos del entrenamiento de los sistema de aprendizaje automático. ¿De dónde sale el material para entrenar un sistema de como GPT-3, Dalle2 o Stable Diffusion? @